期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 融合语料库特征与图注意力网络的短文本分类方法
杨世刚, 刘勇国
《计算机应用》唯一官方网站    2022, 42 (5): 1324-1329.   DOI: 10.11772/j.issn.1001-9081.2021030508
摘要346)   HTML18)    PDF (1121KB)(178)    收藏

短文本分类是自然语言处理(NLP)中的重要研究问题,广泛应用于新闻分类、情感分析、评论分析等领域。针对短文本分类中存在的数据稀疏性问题,通过引入语料库的节点和边权值特征,基于图注意力网络(GAT),提出了一个融合节点和边权值特征的图注意力网络NE-GAT。首先,针对每个语料库构建异构图,利用引力模型(GM)评估单词节点的重要性,并通过节点间的点互信息(PMI)获得边权重;其次,为每个句子构建文本级别图,并将节点重要性和边权重融入节点更新过程。实验结果表明,所提模型在测试集上的平均准确率达到了75.48%,优于用于文本分类的图卷积网络(Text-GCN)、TL-GNN、Text-ING等模型;相较原始GAT,所提模型的平均准确率提升了2.32个百分点,验证了其有效性。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于动态相关性的特征选择算法
陈永波, 李巧勤, 刘勇国
《计算机应用》唯一官方网站    2022, 42 (1): 109-114.   DOI: 10.11772/j.issn.1001-9081.2021010128
摘要318)   HTML13)    PDF (445KB)(308)    收藏

特征选择是从原始数据集中去除无关的特征并选择良好的特征子集,可以避免维数灾难和提高学习算法的性能。为解决已选特征和类别动态变化(DCSF)算法在特征选择过程中只考虑已选特征和类别之间动态变化的信息量,而忽略候选特征和已选特征的交互相关性的问题,提出了一种基于动态相关性的特征选择(DRFS)算法。该算法采用条件互信息度量已选特征和类别的条件相关性,并采用交互信息度量候选特征和已选特征发挥的协同作用,从而选择相关特征并且去除冗余特征以获得优良特征子集。仿真实验表明,与现有算法相比,所提算法能有效地提升特征选择的分类准确率。

图表 | 参考文献 | 相关文章 | 多维度评价